
˜
J(θ; X, y) = J(θ; X, y) + αΩ(θ).
Ω(θ)
k
L(θ, α; X, y) = J(θ; X, y) + α(Ω(θ) − k).
θ
∗
= min
θ
max
α,α≥0
L(θ, α).
θ α α
||θ||
p
> k ||θ||
p
< k
α
∗
θ
θ
∗
= min
θ
L(θ, α
∗
) = min
θ
J(θ; X, y) + α
∗
Ω(θ).
˜
J
α
∗
k
k k α
∗
J
α
α
J(θ) θ
Ω(θ) < k k
α
k